#AI Scaling Law | 熱門關鍵字 | 鉅亨號

【新智元導讀】剛剛，Nature蓋章AI獨立科研時代！全新Scaling Law顯現，人類死守的學術鐵王座，正發生不可逆的轉移。一篇長達數十頁的學術論文，在人類設定研究主題和實驗邊界後，系統自動完成了從實驗到寫作的大部分流程。從論文正文、實驗程式碼、圖表和投稿稿件，主要由系統端到端自動生成。它被投遞到頂尖機器學習會議ICLR 2025某workshop的同行評審流程中，三位匿名審稿人不知道具體那幾篇是AI生成稿件，他們對著這篇稿件分別打出了6、7、6的高分。這個成績，高於約55%的同場投稿。稿件在評審完成後按實驗協議撤回，未進入正式發表階段。這並非科幻，這是剛剛被《Nature》報導的一項震撼研究。該項研究是由Sakana AI聯合牛津大學、UBC共同推出的全自動AI科學家「The AI Scientist」。Sakana AI聯合創始人兼 CEO David Ha在推文中表示，啟動該項目，正是想探索大模型是否能夠完成整個科研全流程：我堅信，AI將永遠改變科學發現和科研進步的方式。全自動「AI科學家」究竟做了什麼？這一次，不是AI在「幫」人幹活，而是AI第一次把科研流程從頭走到尾。一直以來，AI在科研領域的定位都是「高級打工人」：比如幫化學家折疊蛋白質，或是幫程式設計師找bug。定義問題和統籌全域的，始終是人類。The AI Scientist的出現，則顛覆了這套「主僕敘事」，它完整覆蓋了科研的四大核心階段：Idea生成、實驗迭代、論文寫作、自動評審。在全新升級的v2版本中，它甚至走向了「無範本」模式：徹底拋棄人類提供的初始程式碼腳手架，引入了強大的「智能體樹搜尋」（agentic tree search）機制。這意味著它能在龐大的未知解空間裡，同時開啟多條主線平行探索。科研不再是單線程試錯，而變成了一個可擴展的搜尋過程。它怎麼保證自己不和別人撞車？系統會呼叫Semantic Scholar API進行全網查重，確保每一個idea都具備足夠的新穎性。在最棘手的資料可視化環節，它甚至內建了一個視覺語言模型（VLM）作為反饋審閱者。如果坐標軸反了、圖例丟了、展示有歧義，VLM會像嚴苛的導師一樣立刻打回重做，直到生成完美的學術圖表。過去圖表只是論文包裝，現在圖表也成了AI科研的反饋訊號。而完成這堪比博士生幾個月工作量的閉環，它的帳單是：單篇論文15美元。如此驚人的性價比意味著，科研自動化第一次從「局部輔助」跨進了「全鏈路主導」。AI不再只是科學家的輔助工具，而是向更具自主性的科研代理系統演進。AI Scientist工作流程的概念概述，包括提出研究想法、實施實驗、執行實驗、撰寫論文以及審閱論文。通過人類同行評審測試AI寫的論文，人類學術金字塔尖的學者到底認不認？於是，Sakana AI決定玩一把大的：直接向頂會投稿。在獲得ICLR大會領導層、ICBINB workshop組織者以及IRB倫理委員會的特批後，團隊進行了一場極其大膽的「潛伏行動」：將3篇純AI生成的論文混入了人類投稿池。審稿人只被告知「可能有AI生成論文」，但根本不知道具體是那幾篇。結果其中一篇探索神經網路組合正則化（Compositional Regularization）負面結果的論文，斬獲了平均6.33分（弱接收、接收、弱接收）的高分。這個分數不僅穩穩越過了該workshop的平均錄用線，更是超過了55%的真實人類學者。連科學研究中最難寫出彩的負向論證，AI也能寫得有模有樣、邏輯自洽。據Sakana AI團隊所稱，這是全AI生成論文首次在真實學術評審環境中獲得通過接收線的成績。這也標誌著同行評審，真正迎來了「圖靈測試」時刻。AI審稿人比人類更靠譜？如果AI一天能花幾百美元寫出幾十篇論文，人類審稿系統瞬間就會崩潰。想讓AI科研實現指數級爆發，就必須有能夠大規模評估質量的「自動化裁判」。Sakana AI給出的答案是：直接讓AI來當Area Chair（領域主席）。他們建構了一個高度還原NeurIPS官方審稿流程的自動化系統：5個獨立的AI審稿人進行背靠背挑刺，最後由1個AI元審稿人進行共識彙總和最終裁決。在與數千條真實OpenReview人類審稿決策的硬碰硬對比中，自動化審稿人交出了69%的平衡精準率。令人震驚的是，在作者設定的評測框架下，自動審稿系統的部分指標優於所對照的人類一致性結果。有人質疑：AI是不是偷偷背過題？團隊特意用知識截止日期（2025年）之後的全新論文進行了資料污染測試。結果依然堅挺：平衡精準率保持在66%，達到可與人類頂級學者比肩的實戰水準。這表明，AI正在進入過去長期由人類主導的科研流程核心環節。過去，人類同時壟斷了「寫論文的人」和「決定論文是否成立」這兩個關鍵角色。現在，這兩個角色都在被AI切入。一旦評審環節也被自動化，AI科研就不再是零星爆款，而具備了大規模、左右互搏式迭代的基礎設施。該自動審稿系統在頂級會議（ICLR）發表的AI論文上，其審稿判斷與人類審稿人一致，包括在模型訓練完成之後（即超出其「知識截止日期」）發表的論文。這些結果表明，該自動審稿系統在為新撰寫的AI論文提供評審分數方面，可靠性與人類審稿人相當。科研的Scaling Law如果說「過審」證明了AI科研站得住，那真正決定未來天花板的是另一件事：它是不是可持續變強？Nature論文中最具顛覆性的一組資料，揭示了潛藏在AI科研背後的全新定律。研究發現，底層大模型的能力與生成論文的質量之間，呈現出令人頭皮發麻的極度顯著正相關（P<0.00001）。隨著模型發佈日期推進，AI產出的論文質量持續陡峭上升。同時，算力正在暴力改寫科研法則。投入的測試時算力越多，智能體樹搜尋的深度就越深，實驗質量就越紮實，最終的產出評級就越高。當前最頂配的AI科學家，其平均產出已經逼近機器學習頂會workshop的邊緣錄用（borderline accept）水平。這背後展示的是一條正在形成的「科研Scaling Law」。過去的科技突破，依賴於虛無縹緲的靈光乍現，而未來的科學發現，將變成一條可精確計算的工業流水線。隨著模型能力呈指數級增長、推理算力成本呈指數級下降，這套系統會自動升級，這才是這項工作真正展現出恐怖勢能。根據自動評審員的評判，當使用更新、更智能的基礎模型時，AI Scientist生成的論文質量會提高。AI全面接管科研我們準備好了嗎？當然，這篇Nature論文，同樣也指出了The AI Scientist的目前的侷限性：它偶爾會想出幼稚的idea，寫的程式碼會有bug，論文裡會出現引用的幻覺，甚至在附錄裡重複貼上同一張圖表。值得警惕的是，論文顯示該系統具備自動偵錯、重試運行和在受限計算預算下持續迭代實驗的能力。這意味著，未來更強的科研代理一旦出現規避約束的傾向，可能帶來新的安全治理問題。如果這種系統被毫無節制地釋放，海量生成的低門檻論文會瞬間壓垮整個學術生態，學者的學術 credentials（資歷證明）將被徹底稀釋。正因如此，Sakana AI採取了極其克制的立場：主動撤稿、通過IRB審批、呼籲加入生成水印，並急迫要求社區建立全自動AI科研規範。這篇Nature論文不只是展示AI技術的里程碑，更是把AI所帶來的倫理爭議也擺上檯面。真正的問題早已不是「AI能不能做科研」，而是「當AI開始獨立做科學，誰來定義什麼算科學」。正如團隊所設想的終極願景：AI科學家不會讓人類科學家消失，但人類科學家的角色，必須被迫向著科研價值鏈的更上游遷徙：去定義問題、設定邊界、決定那些發現值得被相信。 (新智元)

科技

2025/09/23

•

Spectrum-X，輝達開啟了第二台“印鈔機”

乙太網路交換機的資料中心市場風雲變幻。根據IDC日前發佈的《季度乙太網路交換機追蹤報告》，乙太網路交換機的資料中心細分市場單季收入同比飆升71.6%，其中最值得注意的無疑是輝達，當季，輝達交換機業務收入同比暴增647%，達到23億美元，在資料中心細分市場中以25.9%的份額躍居第一，一舉超越傳統巨頭思科與Arista。這一變化的背後是源於AI驅動的基礎設施變革。當算力進入“億級參數、百萬GPU”的時代，網路不再是後台配角，而是決定AI訓練效率的核心引擎。從GPU之王到AI網路新王者，輝達正完成在AI基礎設施版圖中的關鍵一躍。那麼，這場顛覆是如何發生的？AI Scaling Law驅動，北美引領全球資料中心網路狂飆IDC資料顯示，2025年Q2全球乙太網路交換機市場總收入達145億美元，同比增長42.1%。這一增長幾乎完全由資料中心細分市場需求拉動，尤其是面向AI時代的基礎設施。在AI scaling law的推動下，模型參數量和訓練資料呈指數級上升，對計算密度、記憶體頻寬以及網路通訊性能提出了前所未有的要求。超大規模企業與雲服務商紛紛加速部署支援800GbE甚至更高頻寬的AI專用資料中心，直接引爆了高速交換機市場。第二季度，全球800GbE交換機收入環比暴漲222.1%，佔資料中心市場總收入的12.8%；200/400GbE交換機收入同比增長175.5%，合計佔據近一半市場份額（49.5%）；ODM直供模式同比增長76.9%，顯示出定製化、規模化AI基建的主流趨勢。區域格局上，美洲市場整體增長56.8%，其中美國資料中心市場同比增長高達90.2%，成為全球AI投資的核心引擎。相比之下，歐洲、中東和非洲地區（EMEA）增長33.8%，亞太僅增長24.0%，凸顯了北美在AI基礎設施投入上的絕對領先優勢。交換機市場主要廠商均受益於這一浪潮：Arista Networks收入達18億美元，同比增長33.5%，其中90.7%來自資料中心；HPEAruba Networking的乙太網路交換機收入同比增長9.9%，其中84.9%來自非資料中心市場。而輝達則實現了驚人的647%同比增長，且其全部23億美元集中於資料中心領域，迅速搶佔制高點。反觀老牌龍頭企業思科，儘管其仍以40億美元保持整體收入第一，但其資料中心部分僅增長9.1%，超過三分之二的收入來自增長較緩慢的非資料中心市場。這意味著，在通往智能時代的主航道上，舊王者正在失去話語權。新霸主輝達則找到了它的新武器——Spectrum-X。從挖角思科“頂級發明家”到打造第二台“印鈔機”如果說2019年以70億美元收購Mellanox是輝達進軍高性能網路的第一步，那麼2023年推出的乙太網路網路平台Spectrum-X，是它打造第二台“印鈔機”的開始。Spectrum-X是輝達專為超大規模生成式AI叢集設計的企業級乙太網路解決方案，旨在解決傳統乙太網路在分佈式訓練和推理中的高延遲、抖動大、性能不可預測等根本性瓶頸。它的目標很明確：讓乙太網路具備接近InfiniBand的性能，同時打破其封閉生態與高成本桎梏。2024年10月，又一個標誌性事件發生：曾在思科效力25年、被官方認證為“頂級發明家”的資深工程師JP Vasseur宣佈加盟輝達，負責領導AI與網路架構創新。他的加入被視為輝達加速最佳化Spectrum-X底層演算法與可擴展性的關鍵訊號。就在他加盟一個多月前，輝達首席財務官Colette Kress在財報電話會上明確表示：“我們面向資料中心的Spectrum-X乙太網路產品線，有望在一年內成為價值數十億美元的產品線。”事實證明，這一預言已成為現實。在今年3月舉辦的輝達GTC 2025全球科技大會期間，黃仁勳將Spectrum-X稱為“全壘打式創新”，旨在將乙太網路提升至InfiniBand的性能水平。隨後在8月，輝達再進一步，發佈Spectrum-XGS乙太網路——Spectrum-X平台的重大升級版本。該技術首次實現“跨區域擴展”（scale-across），通過先進的遠距離擁塞控制、精準延遲管理與端到端遙測，將多個物理分散的資料中心整合為統一的“十億瓦級AI超級工廠”。這意味著，在高性能互聯技術的推動下，AI訓練正逐步突破單一建築或園區的限制，朝著像電網一樣靈活調度、分佈式協同的未來邁進。根據Colette Kress的預期，輝達計畫每年推出新一代Spectrum-X晶片與交換機，目標是支撐從數萬個GPU擴展到未來數百萬GPU的巨型叢集。這種持續迭代的能力，將是這台新“印鈔機”穩定運轉的關鍵。結語曾經，人們說輝達靠GPU印鈔；如今，隨著Spectrum-X的成功，在網路層面，輝達也在複製它在計算領域的戰績。屬於輝達的第二台“印鈔機”，已經轟鳴啟動，馬力全開。 (C114通訊網)

美股

2025/03/16

•

Anthropic CEO 訪談「暴論」：半年內，AI能寫90%的程式碼，一年內，AI接管程式設計工作！

Anthropic CEO在最近的一次訪談中，說了一個很「炸裂」的斷言：半年內，90%的程式碼AI都能勝任了！為了查證這句話是否屬實，我們找到了整個訪談的內容，發現Anthropic CEO Dario 確實是這麼說的：我們正逐漸接近一個世界，也許在3到6個月內，AI將能寫出90%的程式碼。而在12個月內，我們可能會進入一個AI幾乎能寫出所有程式碼的世界。不過，程式設計師仍然需要做一些事情，例如定義任務條件、決定整體應用程式的架構、設計決策、如何與現有程式碼協作，以及判斷程式碼是否安全等。

科技

2024/07/03

•

比爾蓋茲最新訪談：Scaling Law快要走到盡頭，超人AI還需新的突破

在蓋茲眼裡，AI對電腦互動的革命還沒到來，但Scaling Law似乎已經看到盡頭了。近日，比爾蓋茲(Bill Gates) 在一期Next Big Idea 播客中討論了人工智慧的未來，以及它如何比人們想像的更接近現實。在過去半個世紀裡，比爾蓋茲在每項重大技術發展中都發揮了主導作用，在預測未來方面，他有著相當不錯的記錄。早在1980 年，他就預測有一天每張桌子上都會有一台電腦；現在，他說很快每個人的耳朵裡都會有一個人工智慧體。主持人魯弗斯·格里斯科姆（Rufus Griscom）和安迪·薩克（Andy Sack）以及亞當·布羅特曼（Adam Brotman）一起（三人為新書《人工智能第一》[AI First]的合著者），與比爾蓋茲討論了人工智慧對醫療保健、教育、生產力和商業的影響。蓋茲對話中提及的觀點，經智能湧現整理如下：

科技